『情報検索 :検索エンジンの実装と評価』

https://gyazo.com/d50b021567655dcd712d1dc05c4a1a73

2020/10/30

梅澤克之翻訳

Neil Rubens 翻訳

松田健翻訳

三川健太翻訳

水野信也翻訳

山本健司翻訳

森北出版

検索の本

Part 1基礎

1 イントロダクション

1.1情報検索とは

1.2情報検索システム

1.3電子テキストの取扱い

1.4テストコレクション

1.5オープンソースIRシステム

1.6さらに学習を進めるために

1.7演習問題

1.8参考文献

2 基本技術

2.1転置インデックス

2.2検索とランキング

2.3評価

2.4まとめ

2.5さらに学習を進めるために

2.6演習問題

2.7参考文献

3 トークンとターム

3.1英語

3.2文字エンコーディング

3.3Nグラム法

3.4その他のヨーロッパ言語

3.5CJK言語

3.6さらに学習を進めるために

3.7演習問題

3.8参考文献

Part 2インデクシング

4 静的転置インデックス

4.1インデックスの構成要素とライフサイクル

4.2辞書

4.3ポスティングリス

4.4インターリービング辞書とポスティングリスト

4.5インデックスの作成

4.6その他のインデックス形式

4.7まとめ

4.8さらに学習を進めるために

4.9演習問題

4.10参考文献

5 クエリ処理

5.1ランキングのためのクエリ処理

5.2軽快な実装

5.3さらに学習を進めるために

5.4演習問題

5.5参考文献

6 インデックス圧縮

6.1データ圧縮概論

6.2シンボル的データ圧縮

6.3ポスティングリストの圧縮

6.4辞書の圧縮

6.5まとめ

6.6さらに学習を進めるために

6.7演習問題

6.8参考文献

7 動的転置インデックス

7.1バッチの更新

7.2増分インデックスの更新

7.3ドキュメントの削除

7.4ドキュメントの変更

7.5さらに学習を進めるために

7.6演習問題

7.7参考文献

Part 3検索とランキング

8 確率的情報検索

8.1関連性のモデル化

8.2バイナリ独立モデル

8.3ロバートソン/スパルク・ジョーンズ重み付け関数

8.4ターム頻度

8.5ドキュメントの長さ: BM25

8.6適合性フィードバック

8.7ドキュメント内フィールドによる重み付け: BM25F

8.8実験による比較

8.9さらに学習を進めるために

8.10演習問題

8.11参考文献

9 言語モデルと関連分野

9.1ドキュメントからのクエリ生成

9.2言語モデルと平滑化

9.3言語モデルによるランキング

9.4カルバック–ライブラー情報量

9.5ランダム性からの距離

9.6パッセージ検索とランキング

9.7実験による比較

9.8さらに学習を進めるために

9.9演習問題

9.10参考文献

10 分類とフィルタ

10.1詳細例

10.2格付け

10.3確率的格付け器

10.4線形格付け器

10.5類似性に基づいた格付け器

10.6一般化線形モデル

10.7情報理論的モデル

10.8実験による比較

10.9さらに学習を進めるために

10.10演習問題

10.11参考文献

11 融合・メタ機械学習

11.1検索結果の融合

11.2スタッキング適応フィルタ

11.3バッチ格付け器のスタッキング

11.4バギング

11.5ブースティング

11.6複数カテゴリのランキングと格付け

11.7ランキング学習

11.8さらに学習を進めるために

11.9演習問題

11.10参考文献

Part 4評価

12 有効性の評価

12.1伝統的な有効性評価

12.2テキスト検索会議(TREC)

12.3統計指標を用いた評価

12.4判断処理数の最小化

12.5新しい有効性評価

12.6さらに学習を進めるために

12.7演習問題

12.8参考文献

13 効率の評価

13.1効率の基準

13.2待ち行列理論

13.3クエリスケジューリング

13.4キャッシング

13.5さらに学習を進めるために

13.6演習問題

13.7参考文献

Part 5大規模情報検索システムの構築方法

14 並列情報検索

14.1並列クエリ処理

14.2マップレデュース

14.3さらに学習を進めるために

14.4演習問題

14.5参考文献

15 Web検索

15.1Webの構造

15.2クエリとユーザ

15.3静的ランキング

15.4動的ランキング

15.5Web検索の評価

15.6Webクローラ

15.7まとめ

15.8さらに学習を進めるために

15.9演習問題

15.10参考文献

16 XML検索

16.1XMLのエッセンス

16.2パス,ツリー,フラワー

16.3インデクシングとクエリ処

16.4ランキング検索

16.5評価

16.6さらに学習を進めるために

16.7演習問題

16.8参考文献

Part 6付録Aコンピュータの性能

A.1ディスクのシーケンシャルアクセスとランダムアクセス

A.2メモリのシーケンシャルアクセスとランダムアクセ

2A.3パイプライン処理と分岐予測

訳者あとがき

索引